<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>模型开发详细介绍 - 炼焦大数据智能诊断系统</title>
    <link rel="stylesheet" href="../styles/main.css">
    <link rel="stylesheet" href="../styles/paper.css">
    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.15.3/css/all.min.css">
</head>
<body>
    <header>
        <div class="container">
            <h1><i class="fas fa-chart-line"></i> 炼焦大数据智能诊断系统</h1>
            <p class="subtitle">数据分析工作平台</p>
        </div>
    </header>

    <nav>
        <div class="container">
            <button class="nav-toggle"><i class="fas fa-bars"></i></button>
            <ul>
                <li><a href="index.html"><i class="fas fa-home"></i> 首页</a></li>
                <li><a href="project_intro.html"><i class="fas fa-project-diagram"></i> 项目介绍</a></li>
                <li><a href="data_prep.html"><i class="fas fa-database"></i> 数据准备</a></li>
                <li><a href="eda.html"><i class="fas fa-search"></i> 探索性分析</a></li>
                <li><a href="modeling.html" class="active"><i class="fas fa-brain"></i> 模型开发</a></li>
                <li><a href="advanced.html"><i class="fas fa-rocket"></i> 高级分析</a></li>
                <li><a href="model.html"><i class="fas fa-cube"></i> 单孔分析模型</a></li>
                <li><a href="timeline.html"><i class="fas fa-calendar-alt"></i> 项目时间线</a></li>
            </ul>
        </div>
    </nav>

    <main class="container paper-container">
        <div class="paper-title">
            <h1>炼焦工艺预测模型构建与评估方法研究</h1>
            <h2>模型开发详细学术介绍</h2>
        </div>
        
        <div class="paper-layout">
            <div class="col-sidebar">
                <div class="toc">
                    <h4>目录</h4>
                    <ul class="toc-list">
                        <li><a href="#abstract">摘要</a></li>
                        <li><a href="#intro">1. 引言</a></li>
                        <li><a href="#problem-definition">2. 问题定义</a></li>
                        <li class="level-2"><a href="#prediction-tasks">2.1 预测任务定义</a></li>
                        <li class="level-2"><a href="#data-characteristics">2.2 数据特性分析</a></li>
                        <li><a href="#model-selection">3. 模型选择</a></li>
                        <li class="level-2"><a href="#traditional-ml">3.1 传统机器学习模型</a></li>
                        <li class="level-2"><a href="#deep-learning">3.2 深度学习模型</a></li>
                        <li class="level-2"><a href="#ensemble">3.3 集成学习模型</a></li>
                        <li><a href="#feature-engineering">4. 特征工程</a></li>
                        <li><a href="#training-validation">5. 模型训练与验证</a></li>
                        <li><a href="#model-evaluation">6. 模型评估</a></li>
                        <li><a href="#case-studies">7. 应用案例</a></li>
                        <li><a href="#deployment">8. 模型部署与维护</a></li>
                        <li><a href="#conclusion">9. 结论与展望</a></li>
                        <li><a href="#references">参考文献</a></li>
                    </ul>
                </div>
            </div>
            
            <div class="col-main">
                <div class="paper-section" id="abstract">
                    <h3>摘要</h3>
                    <div class="paper-abstract">
                        <p>模型开发是炼焦大数据智能诊断系统的核心环节，通过机器学习和深度学习技术，将数据中发现的规律转化为可执行的预测和决策模型。本文详细介绍了炼焦过程模型开发的方法论和实践经验，包括问题定义、模型选择、特征选择、模型训练、评估、优化和部署等全流程内容。针对炼焦工艺的特点，我们开发了多类模型，包括质量预测模型、异常检测模型、参数优化模型和寿命预测模型等。这些模型通过融合领域知识和数据驱动方法，在保证准确性的同时，兼顾可解释性和实用性。实践证明，这些模型在提高产品质量、降低能源消耗、延长设备寿命等方面发挥了重要作用。</p>
                    </div>
                    
                    <div class="keywords" style="margin-bottom: 1rem;">
                        <strong>关键词：</strong> 炼焦工艺、机器学习、预测模型、异常检测、参数优化
                    </div>
                </div>
                
                <!-- 引言部分 -->
                <div class="paper-section" id="intro">
                    <h3>1. 引言</h3>
                    <p>随着工业4.0和智能制造的快速发展，将机器学习技术应用于传统工业过程优化已成为行业趋势。炼焦工艺作为钢铁生产的关键环节，其生产过程复杂、影响因素众多，传统的经验模型往往难以准确描述各变量间的复杂关系，更难以应对动态变化的生产环境。</p>
                    
                    <p>本文介绍的模型开发方法，基于炼焦大数据智能诊断系统的实际需求，针对焦化行业的特点，系统性地开发了一系列预测模型和优化模型。这些模型不是简单地套用通用算法，而是深度融合了炼焦工艺的领域知识，通过特征工程、模型设计、参数优化等环节，使模型更好地适应炼焦生产的实际场景。</p>
                    
                    <p>模型开发过程中，我们特别关注了模型的可解释性和实用性，确保模型不仅能给出准确的预测结果，还能提供合理的解释和建议，便于生产人员理解和采纳。同时，模型的实时性和鲁棒性也得到了充分考虑，使其能够在生产环境中稳定运行。</p>
                </div>
                
                <div class="paper-section" id="problem-definition">
                    <h3>2. 问题定义</h3>
                    <p>在炼焦大数据智能诊断系统中，模型开发需要解决一系列复杂的业务问题。这些问题可以归纳为预测类、分类类、异常检测类和优化类四大类。为确保模型的科学性和实用性，我们对每类问题进行了严谨的数学定义和边界条件设定。</p>
                    
                    <h4>2.1 质量预测问题</h4>
                    <p>质量预测是炼焦生产中的核心问题，主要包括全焦率、抗碎强度(M40)、耐磨强度(M10)、反应后强度(CSR)等关键指标的预测。</p>
                    
                    <div class="highlight-box">
                        <h4>问题定义：</h4>
                        <p>给定输入特征向量 X = {x₁, x₂, ..., xₙ}，其中包含煤的物理化学性质、装煤操作参数、炉温曲线特征等n个特征，构建函数f，使得：</p>
                        <p>y = f(X)</p>
                        <p>其中y为目标质量指标（如全焦率），使预测值与实际值之间的误差最小化。</p>
                    </div>
                    
                    <p>焦炭质量预测的关键挑战在于：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>输入特征之间存在复杂的非线性关系</li>
                        <li>质量指标受多种因素影响，存在时滞效应</li>
                        <li>实验室检测数据与生产数据的时间匹配问题</li>
                        <li>不同季节、不同煤种条件下模型泛化能力的保证</li>
                    </ul>
                    
                    <h4>2.2 异常检测问题</h4>
                    <p>异常检测旨在及时发现炼焦过程中的异常工况，防止质量事故和设备损坏。</p>
                    
                    <div class="highlight-box">
                        <h4>问题定义：</h4>
                        <p>给定时序数据序列 S = {s₁, s₂, ..., sₜ}，构建函数g，使得：</p>
                        <p>g(S) = {0, 1}</p>
                        <p>其中0表示正常状态，1表示异常状态。</p>
                    </div>
                    
                    <p>异常检测的主要挑战包括：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>异常数据样本少，难以建立有监督模型</li>
                        <li>多种类型异常的界定标准不同</li>
                        <li>需要区分噪声和真实异常</li>
                        <li>异常检出与误报之间的平衡</li>
                    </ul>
                    
                    <h4>2.3 参数优化问题</h4>
                    <p>参数优化问题是指在保证质量的前提下，寻找最优的工艺参数组合，以提高生产效率和降低能源消耗。</p>
                    
                    <div class="highlight-box">
                        <h4>问题定义：</h4>
                        <p>max/min F(P) = {f₁(P), f₂(P), ..., fₘ(P)}</p>
                        <p>s.t. P ∈ Ω</p>
                        <p>其中P为工艺参数向量，F为多目标函数向量，包括质量指标、产能指标和能耗指标等，Ω为参数可行域。</p>
                    </div>
                    
                    <p>参数优化面临的挑战：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>多目标之间存在冲突，需要寻找帕累托最优解</li>
                        <li>生产环境动态变化，优化结果需要适时调整</li>
                        <li>优化建议需要具备可操作性</li>
                    </ul>
                    
                    <h4>2.4 推焦时间预测问题</h4>
                    <p>推焦时间预测是确定最佳出焦时机的问题，直接影响焦炭质量和生产节奏。</p>
                    
                    <div class="highlight-box">
                        <h4>问题定义：</h4>
                        <p>给定当前炭化室的状态向量S和历史数据H，预测最优推焦时间T：</p>
                        <p>T = h(S, H)</p>
                        <p>使得焦炭质量达到要求，同时优化生产效率。</p>
                    </div>
                    
                    <p>推焦时间预测的难点：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>不同煤种和不同装煤条件下炭化速度的差异</li>
                        <li>温度曲线与焦炭成熟度的关系不是简单的线性关系</li>
                        <li>需要平衡质量和产能的矛盾</li>
                    </ul>
                </div>
                
                <!-- 模型选择部分 -->
                <div class="paper-section" id="model-selection">
                    <h3>3. 模型选择</h3>
                    <p>针对上述定义的问题，我们需要选择合适的算法和模型。模型选择不仅要考虑预测精度，还需考虑可解释性、计算效率、模型复杂度等多方面因素。</p>
                    
                    <h4>3.1 回归模型选择</h4>
                    <p>对于质量预测等回归问题，我们评估了以下模型：</p>
                    <table class="paper-table">
                        <thead>
                            <tr>
                                <th>模型类型</th>
                                <th>优势</th>
                                <th>局限性</th>
                                <th>适用场景</th>
                            </tr>
                        </thead>
                        <tbody>
                            <tr>
                                <td>多元线性回归</td>
                                <td>简单直观，可解释性强</td>
                                <td>无法捕捉非线性关系</td>
                                <td>变量间关系近似线性的简单预测</td>
                            </tr>
                            <tr>
                                <td>随机森林回归</td>
                                <td>抗过拟合，处理异常值能力强</td>
                                <td>计算开销大，可解释性较弱</td>
                                <td>特征重要性分析，中等复杂度预测</td>
                            </tr>
                            <tr>
                                <td>XGBoost</td>
                                <td>精度高，训练速度快</td>
                                <td>参数调优复杂</td>
                                <td>高精度预测需求，有足够训练数据</td>
                            </tr>
                            <tr>
                                <td>深度神经网络</td>
                                <td>可学习复杂非线性关系</td>
                                <td>需大量数据，黑盒特性</td>
                                <td>有大量历史数据的复杂系统建模</td>
                            </tr>
                        </tbody>
                    </table>
                    
                    <p>在实际应用中，我们采用了集成学习方法，综合多个模型的预测结果，以获得更稳定可靠的预测。</p>
                    
                    <h4>3.2 异常检测模型选择</h4>
                    <p>针对异常检测问题，我们考察了以下方法：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>统计控制图</strong>：基于3σ原则的传统方法，适用于服从正态分布的参数监控</li>
                        <li><strong>局部异常因子(LOF)</strong>：基于密度的无监督异常检测方法，适合发现局部异常点</li>
                        <li><strong>孤立森林</strong>：基于树的异常检测算法，计算效率高，适合高维数据</li>
                        <li><strong>自编码器</strong>：基于深度学习的无监督异常检测方法，可学习数据的隐含特征</li>
                        <li><strong>长短期记忆网络(LSTM)</strong>：适用于时序数据的异常检测，可捕捉时间序列的长期依赖关系</li>
                    </ul>
                    
                    <p>在我们的系统中，根据不同的异常类型和数据特征，采用了混合模型策略，结合多种异常检测方法的优势。</p>
                    
                    <h4>3.3 优化模型选择</h4>
                    <p>对于工艺参数优化和推焦时间优化问题，我们采用了以下方法：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>遗传算法</strong>：适用于多目标优化问题，可以并行搜索解空间</li>
                        <li><strong>粒子群优化</strong>：收敛速度快，适合参数空间连续的优化问题</li>
                        <li><strong>贝叶斯优化</strong>：适合计算开销大的优化问题，可以减少评估次数</li>
                        <li><strong>强化学习</strong>：通过与环境交互学习最优策略，适合动态变化的生产环境</li>
                    </ul>
                    
                    <p>在实际应用中，我们将预测模型和优化模型结合，构建了基于模型的优化框架，先通过预测模型建立工艺参数与质量、产能之间的映射关系，再通过优化算法求解最优工艺参数。</p>
                </div>
                
                <!-- 特征选择部分 -->
                <div class="paper-section" id="feature-engineering">
                    <h3>4. 特征工程</h3>
                    <p>特征选择是确保模型性能的关键环节。在炼焦过程建模中，我们面临大量可能相关的特征，如何从中选择最具代表性和预测能力的特征集合是模型成功的基础。</p>
                    
                    <h4>4.1 特征分类</h4>
                    <p>根据炼焦工艺特点，我们将特征分为以下几类：</p>
                    <div class="info-grid" style="grid-template-columns: repeat(2, 1fr); gap: 1rem;">
                        <div>
                            <h5>煤质特征</h5>
                            <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                                <li>元素分析：C, H, O, N, S等含量</li>
                                <li>工业分析：水分, 灰分, 挥发分, 固定碳</li>
                                <li>热塑性：黏结指数, 胶质层最大厚度</li>
                                <li>煤岩组成：镜质组, 惰质组, 壳质组比例</li>
                            </ul>
                        </div>
                        <div>
                            <h5>操作参数</h5>
                            <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                                <li>装煤参数：装煤量, 装煤密度, 装煤水分</li>
                                <li>加热参数：炉温, 燃气成分, 热流密度</li>
                                <li>操作节奏：荒煤气抽力, 结焦时间</li>
                                <li>环境因素：环境温度, 湿度</li>
                            </ul>
                        </div>
                    </div>
                    <div class="info-grid" style="grid-template-columns: repeat(2, 1fr); gap: 1rem;">
                        <div>
                            <h5>设备状态</h5>
                            <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                                <li>炉壁状况：炉龄, 炉墙厚度</li>
                                <li>门框密封状况：漏风指数</li>
                                <li>机械设备状态：推焦机, 装煤车状态</li>
                            </ul>
                        </div>
                        <div>
                            <h5>时序特征</h5>
                            <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                                <li>温度曲线特征：升温速率, 最高温度, 温度波动</li>
                                <li>压力曲线特征：最大压力, 压力波动</li>
                                <li>气体成分变化：氧含量, 一氧化碳含量变化</li>
                            </ul>
                        </div>
                    </div>
                    
                    <h4>4.2 特征选择方法</h4>
                    <p>我们采用多种特征选择方法相结合的策略：</p>
                    
                    <div class="highlight-box">
                        <h4>特征选择流程：</h4>
                        <ol style="padding-left: 1.5rem; margin-top: 0.5rem;">
                            <li><strong>专家知识筛选</strong>：基于领域专家经验，初步确定可能相关的特征集</li>
                            <li><strong>相关性分析</strong>：计算特征与目标变量的相关系数，筛选高相关性特征</li>
                            <li><strong>多重共线性检测</strong>：通过方差膨胀因子(VIF)分析，去除高度相关特征</li>
                            <li><strong>特征重要性评估</strong>：利用随机森林、XGBoost等模型的特征重要性指标</li>
                            <li><strong>递归特征消除</strong>：反复构建模型并移除最不重要的特征</li>
                            <li><strong>交叉验证验证</strong>：通过交叉验证评估不同特征组合的模型性能</li>
                        </ol>
                    </div>
                    
                    <p>对于时序数据，我们进行了特征提取工作：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>统计特征：均值、标准差、最大值、最小值、分位数等</li>
                        <li>时域特征：趋势、季节性、周期性、自相关性等</li>
                        <li>频域特征：通过FFT变换提取频谱特征</li>
                        <li>小波特征：通过小波变换提取多尺度特征</li>
                    </ul>
                    
                    <div style="text-align: center; margin: 1.5rem 0;">
                        <figure>
                            <img src="../images/feature_importance.svg" alt="特征重要性分析图" style="max-width: 100%; height: auto; max-height: 300px;">
                            <figcaption>图1. 焦炭质量预测模型的特征重要性分析</figcaption>
                        </figure>
                    </div>
                    
                    <h4>4.3 特征选择结果</h4>
                    <p>通过特征选择，我们发现以下特征对焦炭质量预测最为重要：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>煤的黏结指数和胶质层最大厚度</li>
                        <li>挥发分和灰分含量</li>
                        <li>装煤密度和水分</li>
                        <li>炉温曲线的升温速率和最高温度</li>
                        <li>结焦时间</li>
                    </ul>
                    
                    <p>对于异常检测，以下特征最为关键：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>温度曲线的波动性和偏离度</li>
                        <li>压力曲线的异常峰值</li>
                        <li>气体成分的突变</li>
                        <li>设备振动和噪声特征</li>
                    </ul>
                </div>
                
                <div class="paper-section" id="training-validation">
                    <h3>5. 模型训练与验证</h3>
                    <p>模型训练是将选定的算法应用于处理后的数据，构建可用于预测和决策的数学模型的过程。针对炼焦大数据智能诊断系统的不同需求，我们采用了多种训练策略。</p>
                    
                    <h4>5.1 数据准备</h4>
                    <p>在模型训练前，我们对数据进行了系统性的准备工作：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>数据清洗</strong>：识别并处理异常值、缺失值和重复数据</li>
                        <li><strong>数据转换</strong>：数值特征的归一化/标准化，类别特征的独热编码</li>
                        <li><strong>时间对齐</strong>：确保不同来源数据的时间戳一致性</li>
                        <li><strong>数据分割</strong>：按7:2:1比例分为训练集、验证集和测试集</li>
                        <li><strong>数据增强</strong>：对于样本量不足的情况，采用合成少数类过采样技术(SMOTE)</li>
                    </ul>
                    
                    <h4>5.2 训练方法</h4>
                    <p>针对不同类型的模型，我们采用了相应的训练方法：</p>
                    
                    <h5>5.2.1 质量预测模型训练</h5>
                    <p>质量预测模型采用了集成学习策略，主要步骤包括：</p>
                    <ol style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>基础模型训练：分别训练随机森林、XGBoost、神经网络等基础模型</li>
                        <li>参数优化：使用网格搜索和贝叶斯优化方法寻找最优超参数</li>
                        <li>模型集成：通过堆叠(Stacking)方法组合多个基础模型</li>
                        <li>偏差分析：分析模型在不同工况下的预测偏差，进行针对性调整</li>
                    </ol>
                    
                    <div class="highlight-box">
                        <h4>关键超参数设置：</h4>
                        <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                            <li>随机森林：树数量=200, 最大深度=15, 最小叶节点样本数=5</li>
                            <li>XGBoost：学习率=0.05, 最大深度=8, 正则化参数λ=1.2, α=0.8</li>
                            <li>神经网络：隐藏层=[128, 64, 32], 激活函数=ReLU, 优化器=Adam, 学习率=0.001</li>
                        </ul>
                    </div>
                    
                    <h5>5.2.2 异常检测模型训练</h5>
                    <p>异常检测模型主要基于无监督学习和半监督学习方法：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>基于正常数据训练自编码器，利用重建误差检测异常</li>
                        <li>使用长短期记忆网络(LSTM)建立时序预测模型，预测偏差大的点判定为异常</li>
                        <li>基于历史数据构建统计控制图，设定报警阈值</li>
                        <li>采用孤立森林算法训练全局异常检测器</li>
                    </ul>
                    
                    <h5>5.2.3 优化模型训练</h5>
                    <p>优化模型训练结合了预测模型和优化算法：</p>
                    <ol style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>构建工艺参数与质量、产能、能耗之间的映射关系模型</li>
                        <li>定义多目标优化函数和约束条件</li>
                        <li>应用遗传算法或粒子群算法搜索最优参数组合</li>
                        <li>利用实际生产验证结果调整优化模型</li>
                    </ol>
                    
                    <h4>5.3 训练策略</h4>
                    <p>为提高模型的泛化能力和鲁棒性，我们采用了以下训练策略：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>分层训练</strong>：按不同煤种、不同季节分别训练模型，再进行整合</li>
                        <li><strong>迁移学习</strong>：利用已有模型的知识，加速新炭化室或新煤种的模型训练</li>
                        <li><strong>在线学习</strong>：模型部署后，持续收集新数据，定期更新模型</li>
                        <li><strong>主动学习</strong>：识别预测不确定性高的样本，优先收集这些样本的标签</li>
                    </ul>
                    
                    <div style="text-align: center; margin: 1.5rem 0;">
                        <figure>
                            <img src="../images/model_training.svg" alt="模型训练流程图" style="max-width: 100%; height: auto; max-height: 300px;">
                            <figcaption>图2. 质量预测模型训练流程</figcaption>
                        </figure>
                    </div>
                </div>
                
                <div class="paper-section" id="model-evaluation">
                    <h3>6. 模型评估</h3>
                    <p>模型评估是确保模型性能和可靠性的关键环节。我们建立了全面的评估体系，从多个维度评估模型的预测准确性、泛化能力、鲁棒性和实用性。</p>
                    
                    <h4>6.1 评估指标</h4>
                    <p>针对不同类型的模型，我们采用了不同的评估指标：</p>
                    
                    <h5>6.1.1 回归模型评估指标</h5>
                    <table class="paper-table">
                        <thead>
                            <tr>
                                <th>指标</th>
                                <th>计算方法</th>
                                <th>适用场景</th>
                            </tr>
                        </thead>
                        <tbody>
                            <tr>
                                <td>均方误差(MSE)</td>
                                <td>预测值与真实值差值的平方和的平均值</td>
                                <td>对误差大小敏感的场景</td>
                            </tr>
                            <tr>
                                <td>平均绝对误差(MAE)</td>
                                <td>预测值与真实值绝对差值的平均值</td>
                                <td>需要直观理解误差的场景</td>
                            </tr>
                            <tr>
                                <td>决定系数(R²)</td>
                                <td>模型解释的方差比例</td>
                                <td>比较不同模型的拟合优度</td>
                            </tr>
                            <tr>
                                <td>平均绝对百分比误差(MAPE)</td>
                                <td>预测值与真实值相对误差的平均值</td>
                                <td>需要评估相对误差的场景</td>
                            </tr>
                        </tbody>
                    </table>
                    
                    <h5>6.1.2 分类与异常检测模型评估指标</h5>
                    <table class="paper-table">
                        <thead>
                            <tr>
                                <th>指标</th>
                                <th>计算方法</th>
                                <th>适用场景</th>
                            </tr>
                        </thead>
                        <tbody>
                            <tr>
                                <td>准确率(Accuracy)</td>
                                <td>正确预测的样本比例</td>
                                <td>类别平衡的分类问题</td>
                            </tr>
                            <tr>
                                <td>精确率(Precision)</td>
                                <td>预测为正类中实际为正类的比例</td>
                                <td>假阳性成本高的场景</td>
                            </tr>
                            <tr>
                                <td>召回率(Recall)</td>
                                <td>实际为正类中被正确预测的比例</td>
                                <td>假阴性成本高的场景</td>
                            </tr>
                            <tr>
                                <td>F1分数</td>
                                <td>精确率和召回率的调和平均</td>
                                <td>需要平衡精确率和召回率</td>
                            </tr>
                            <tr>
                                <td>ROC曲线下面积(AUC)</td>
                                <td>不同阈值下TPR和FPR构成的曲线下面积</td>
                                <td>评估模型的区分能力</td>
                            </tr>
                        </tbody>
                    </table>
                    
                    <h4>6.2 验证方法</h4>
                    <p>为确保评估结果的可靠性，我们采用了多种验证方法：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>k折交叉验证</strong>：将数据分为k份，轮流使用k-1份训练，1份验证</li>
                        <li><strong>时间序列交叉验证</strong>：考虑时间顺序，使用历史数据预测未来</li>
                        <li><strong>留一法验证</strong>：对于样本量少的情况，每次留一个样本作为验证集</li>
                        <li><strong>独立测试集验证</strong>：使用从未参与训练和参数调优的独立数据集进行评估</li>
                    </ul>
                    
                    <h4>6.3 评估结果</h4>
                    <p>我们对系统中的核心模型进行了详细评估，主要结果如下：</p>
                    
                    <h5>6.3.1 质量预测模型评估结果</h5>
                    <div style="text-align: center; margin: 1.5rem 0;">
                        <figure>
                            <img src="../images/quality_prediction.svg" alt="质量预测模型评估结果" style="max-width: 100%; height: auto; max-height: 300px;">
                            <figcaption>图3. 全焦率预测模型的实际值与预测值对比</figcaption>
                        </figure>
                    </div>
                    
                    <p>质量预测模型评估结果：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>全焦率预测：MAPE = 0.8%, R² = 0.92</li>
                        <li>抗碎强度M40预测：MAPE = 1.2%, R² = 0.89</li>
                        <li>反应后强度CSR预测：MAPE = 1.5%, R² = 0.87</li>
                    </ul>
                    
                    <h5>6.3.2 异常检测模型评估结果</h5>
                    <p>异常检测模型性能：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>温度曲线异常检测：精确率 = 92%, 召回率 = 88%, F1 = 0.90</li>
                        <li>压力异常检测：精确率 = 94%, 召回率 = 85%, F1 = 0.89</li>
                        <li>设备异常检测：AUC = 0.95</li>
                    </ul>
                    
                    <h5>6.3.3 推焦时间优化模型评估结果</h5>
                    <p>推焦时间优化模型评估：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>推焦时间预测平均误差：±8分钟</li>
                        <li>优化后质量合格率提升：2.5%</li>
                        <li>平均结焦周期缩短：15分钟</li>
                    </ul>
                    
                    <h4>6.4 模型对比分析</h4>
                    <p>我们对比了不同算法和模型组合的性能，发现：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li>集成模型相比单一模型性能提升5-10%</li>
                        <li>深度学习模型在有足够数据时优于传统机器学习模型</li>
                        <li>考虑时序特征的模型比仅使用静态特征的模型准确度高15%</li>
                        <li>融合领域知识的模型比纯数据驱动模型更鲁棒</li>
                    </ul>
                </div>
                
                <div class="paper-section" id="model-optimization">
                    <h3>7. 模型优化</h3>
                    <p>模型优化是提升模型性能、稳定性和实用性的关键步骤。在炼焦大数据智能诊断系统中，我们采用了多种优化技术，确保模型在实际生产环境中的有效应用。</p>
                    
                    <h4>7.1 超参数优化</h4>
                    <p>超参数是指在模型训练前需要设定的参数，不同的超参数设置会导致模型性能的显著差异。我们采用以下方法进行超参数优化：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>网格搜索</strong>：系统地尝试预定义的参数组合，找出最优配置</li>
                        <li><strong>随机搜索</strong>：在参数空间随机采样，适合参数空间较大的情况</li>
                        <li><strong>贝叶斯优化</strong>：利用过去的评估结果，智能地选择下一组参数进行评估</li>
                        <li><strong>遗传算法</strong>：模拟自然选择过程，通过进化寻找最优参数组合</li>
                    </ul>
                    
                    <p>通过超参数优化，我们的模型性能平均提升了12%。</p>
                    
                    <h4>7.2 模型结构优化</h4>
                    <p>除了超参数优化，我们还对模型结构进行了优化：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>特征交互</strong>：引入特征交叉项，捕捉特征间的非线性关系</li>
                        <li><strong>注意力机制</strong>：在深度学习模型中引入注意力层，关注最相关的特征和时间点</li>
                        <li><strong>残差连接</strong>：减轻深度网络的梯度消失问题，提高训练稳定性</li>
                        <li><strong>多任务学习</strong>：同时预测多个相关目标，共享底层特征表示</li>
                    </ul>
                    
                    <div style="text-align: center; margin: 1.5rem 0;">
                        <figure>
                            <img src="../images/model_structure.svg" alt="优化后的模型结构" style="max-width: 100%; height: auto; max-height: 300px;">
                            <figcaption>图4. 引入注意力机制的深度学习模型结构</figcaption>
                        </figure>
                    </div>
                    
                    <h4>7.3 集成学习</h4>
                    <p>集成学习是提高模型稳定性和准确性的有效手段。我们采用了以下集成策略：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>投票集成</strong>：对于分类问题，采用多数投票策略</li>
                        <li><strong>平均集成</strong>：对于回归问题，计算多个模型预测值的平均</li>
                        <li><strong>加权集成</strong>：根据各模型在验证集上的表现赋予不同权重</li>
                        <li><strong>堆叠集成</strong>：使用元学习器整合基础模型的预测结果</li>
                    </ul>
                    
                    <p>集成学习不仅提高了预测准确性，还降低了模型的方差，使预测结果更加稳定可靠。</p>
                    
                    <h4>7.4 正则化与防止过拟合</h4>
                    <p>为防止模型过拟合，我们采用了多种正则化技术：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>L1和L2正则化</strong>：在损失函数中添加惩罚项，控制模型复杂度</li>
                        <li><strong>Dropout</strong>：在神经网络训练中随机丢弃部分神经元，防止共适应</li>
                        <li><strong>早停</strong>：监控验证集性能，在过拟合开始前停止训练</li>
                        <li><strong>数据增强</strong>：通过添加噪声、扰动等方式扩充训练数据</li>
                    </ul>
                    
                    <h4>7.5 计算效率优化</h4>
                    <p>在实际生产环境中，模型的计算效率也是一个重要考虑因素。我们采取了以下措施提高计算效率：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>模型剪枝</strong>：移除对预测贡献小的部分，减小模型大小</li>
                        <li><strong>知识蒸馏</strong>：使用复杂模型训练简单模型，平衡性能和效率</li>
                        <li><strong>量化</strong>：降低模型参数的精度，减少存储和计算需求</li>
                        <li><strong>批处理</strong>：对多个样本同时进行预测，提高吞吐量</li>
                    </ul>
                    
                    <h4>7.6 领域适应</h4>
                    <p>为了使模型更好地适应炼焦生产的特点，我们进行了领域适应优化：</p>
                    <ul style="padding-left: 1.5rem; margin-top: 0.5rem;">
                        <li><strong>季节性调整</strong>：针对不同季节的温度、湿度条件，调整模型预测</li>
                        <li><strong>煤种适应</strong>：针对不同煤种特性，建立煤种特异性的调整因子</li>
                        <li><strong>设备老化考虑</strong>：考虑设备状态和炉龄的影响，动态调整模型预测</li>
                        <li><strong>专家知识融合</strong>：将专家经验规则作为约束条件或先验知识融入模型</li>
                    </ul>
                    
                    <p>通过这些优化措施，我们的模型不仅在实验室评估中表现优异，在实际生产环境中也展现出良好的适应性和稳定性。模型优化是一个持续的过程，随着生产条件的变化和新数据的积累，我们会定期评估模型性能并进行必要的调整和更新。</p>
                </div>
                
                <!-- 更多内容将在后续添加 -->
                <div class="paper-section">
                    <h3>快速导航</h3>
                    <div style="display: flex; justify-content: space-between; flex-wrap: wrap; gap: 1rem;">
                        <a href="modeling.html" class="btn btn-primary"><i class="fas fa-brain"></i> 返回模型开发</a>
                        <a href="eda.html" class="btn btn-secondary"><i class="fas fa-search"></i> 探索性分析</a>
                        <a href="advanced.html" class="btn btn-accent"><i class="fas fa-rocket"></i> 高级分析</a>
                    </div>
                </div>
            </div>
        </div>
    </main>

    <footer>
        <div class="container">
            <div class="footer-content">
                <div class="footer-logo">
                    <h2><i class="fas fa-chart-line"></i> 炼焦大数据智能诊断系统</h2>
                    <p>数据分析工作平台</p>
                </div>
                <div class="footer-links">
                    <h3>快速链接</h3>
                    <ul>
                        <li><a href="index.html">首页</a></li>
                        <li><a href="project_intro.html">项目介绍</a></li>
                        <li><a href="data_prep.html">数据准备</a></li>
                        <li><a href="eda.html">探索性分析</a></li>
                        <li><a href="modeling.html">模型开发</a></li>
                        <li><a href="advanced.html">高级分析</a></li>
                        <li><a href="model.html">单孔分析模型</a></li>
                        <li><a href="timeline.html">项目时间线</a></li>
                    </ul>
                </div>
                <div class="footer-contact">
                    <h3>联系我们</h3>
                    <p><i class="fas fa-envelope"></i> data-analysis@coking-system.com</p>
                    <p><i class="fas fa-phone"></i> +86 123 4567 8910</p>
                    <p><i class="fas fa-map-marker-alt"></i> 钢铁厂数据分析中心</p>
                </div>
            </div>
            <div class="footer-bottom">
                <p>&copy; 2025 炼焦大数据智能诊断系统. 保留所有权利.</p>
            </div>
        </div>
    </footer>
    
    <script src="../scripts/main.js"></script>
</body>
</html> 